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摘要 : 为 了 提高 基因 表达 效率 从 而 利用 叶绿体 基因 工程 改良 巨 校 重 要 性 状 , 该 文 以 巨 校 叶 绿 
体 基因 组 序列 为 材料 , 选取 其 中 长 于 300nt 且 以 AUG 为 起 始 密码 子 的 43 A dE SE EAE DAL 
究 对 象 ， 采 用 CodonW1.4.2 软件 分 析 巨 核 叶绿体 基因 组 的 密码 子 使 用 偏好 性 。 分 析 结 果 表 
gj: 第 3 位 密码 子 的 平均 GC 含量 为 27.97%; ENC 的 变化 范围 为 39.49~61.00, 平均 为 47.04; 
RSCU>1 的 密码 子 有 31 个 ， 其 中 29 个 以 AU 结尾 ， 中 性 分 析 显 示 GC12 与 GC3 无 显著 相 
关 ， 回 归 分 析 也 未 达到 显著 性 水 平 ，ENC-plot 分 析 发 现 大 部 分 基因 落 在 曲线 上 或 附近 ; 对 
应 分 析 表 明 第 一 轴 的 贡献 率 为 17.68%， 第 二 轴 的 贡献 率 为 11.49%， 第 三 、 四 轴 的 贡献 率 分 

别 为 8.00% 和 5.76%， 前 四 轴 累 计 贡 献 率 达 42.93%， 第 一 轴 与 GC、ENC、CAI 达到 极 显 著 
相关 ; 上 述 分 析 结 果 表 明 ， 巨 校 叶绿体 基因 组 的 密码 子 偏好 较 弱 ， 密 码 子 第 3 位 偏好 以 A 
或 U 结尾 ; 选择 和 突变 在 巨 校 叶绿体 基因 组 密码 子 偏好 中 起 相对 均衡 的 作用 ; 最终 确定 
UUG、CUU、GUU、UCC、UCA、ACA、UAU、UAA、CAU、AAU、AGA GGA 12 个 
高 频 高 表达 密码 子 为 最 优 密码 子 。 该 研究 为 转化 叶绿体 基因 密码 子 优化 从 而 提高 表达 效率 改 
良 巨 核 目 标 性 状 芮 定 了 坚实 基础 。 
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Abstract: In order to increase the expression efficiency of genes in chloroplast for future 
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improvement of important traits in Eucalyptus grandis, analysis of codon bias was carried out 
using CodonW 1.4.2 software, with chloroplast genome of Eucalyptus grandis as a material and 
43 non-repeated genes beginning with AUG as objects. The results indicated that the average of 
GC content in 3™ position was 27.9796; ENC ranged from 39.49 to 61.00 with an average of 47.04; 
there were 31 codons whose RSCUS were more than 1.00 in the chloroplast genome; of them, 29 
codons ended with A/U; neutral plot analysis showed correction and regression analysis between 
GC12 and GC3 were not significant; ENC-plot revealed most genes located along or near the 
standard curve; correspondence analysis indicated the 1* axis accounted for 17.6896 contribution, 
the 274 axis 11.4996, the rest axes accounted for 8.0096 and 5.7696 and the first four axes 
accounted for 42.93% in total; the correction between the 1* axis and GC3S was not significant, 
however the negative correction between 1* axis and ENC was significant. The results mentioned 
above revealed that the codon bias level was low in the chloroplast genome and the codon always 
end with A/U and codon bias might be determined by both mutation and selection nearly equally. 
Finally, the codons that were not only highly expressed but frequently were determined as the 
optimal codons including UUG, CUU, GUU, UCC, UCA, ACA, UAU, UAA, CAU, AAU, AGA 
and GGA. This study will provide a solid foundation for codon optimization of the genes 
transformed into chloroplast genome and future increasing the expression efficiency for 


improvement of important traits. 
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E f(Eucalyptus grandis) 原 产 于 澳大利亚 ， 为 桃 金 娘 科 校 属 中 的 一 个 多 年 生 木 本 树种 。 
因 其 生长 迅速 ， 树 形 通 直 ， 树 体高 大 ， 巨 校 被 引种 至 世界 各 地 广泛 种 植 ， 成 为 各 国 重 要 的 外 
来 树种 ( 祁 述 雄 ，2006; 陈 少 雄 等 ，2018)。 因 此 ， 研 究 人 员 在 引种 驯化 的 基础 上 开展 了 种 源 / 
家 系 / 单 株 不 同性 状 变异 研究 ;结果 表明 ， 巨 校 的 抗 寒 性 不 足 ( 刘 建 等 , 2009)， 易 受 瘦 姬 小 蜂 
感染 ( 张 照 远 等 , 2016), 不 同 遗 传 资源 在 生长 和 形 质 方面 也 存在 较 大 差异 ( 吴 世 军 等 , 2016; 张 
捷 等 , 2016)。 

基因 工程 技术 育种 与 传统 育种 技术 相 比 具有 针对 性 强 ， 周 期 得， 效率 高 等 明显 优势 ( 王 
RØMT E, 2014)。 叶 绿 体 基因 工程 具有 明显 的 高 效 表达 ， 并 能 有 效 控制 转化 基因 的 扩散 
等 特点 ， 是 极为 理想 的 转化 方式 Daniell & Chase, 2004)。 密 码 子 被 称 为 第 二 套 遗 传 密码 
(Nelson & Cox, 2017; Hanson & Coller, 2018); 密码 子 使 用 的 选择 不 仅 影 响 基因 的 表达 (Zhou 
etal, 2016)， 也 影响 基因 相应 的 功能 (Hershberg & Petrov, 2008)。 不 同 物种 间 叶 绿 体 基 因 组 的 
密码 子 偏好 存在 较 大 差异 (Zhou et al, 2008; X 3$ 55, 2017; 王 鹏 和 良 等 , 2018; EXW, 
2018)。 本 文 则 在 分 析 巨 核 叶绿体 基因 组 密码 子 偏 好 性 的 特征 ， 并 确定 其 最 优 密 码 子 ， 为 巨 
校 叶 绿 体 基 因 工 程 的 开展 和 遗传 改良 黄 定 基础 。 


1. 材料 和 方法 


1.1 序列 

从 NCBI 网 站 的 细胞 器 基因 组 网 页 中 搜索 巨 校 的 拉丁 名 : Eucalyptus grandis 找到 巨 核 的 
叶绿体 基因 组 (https:/www.ncbi.nlm.nih.gov/nuccore/NC_014570.1)， 下 载 其 Fasta 格式 的 全 
基因 组 和 基因 编码 序列 (Coding sequences)。 巨 核 叶 绿 体 基 因 组 总 长 为 160137bp， 共 含有 75 
个 基因 。 为 了 降低 误差 , 本 文选 用 其 中 以 AUG 为 起 始 密码 子 且 长 度 超过 300nt 的 43 条 非 重 
复 序列 用 于 密码 子 偏好 性 分 析 。 
1.2 数据 分 析 
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1.2.1 密码 子 偏好 参数 计算 

以 所 选 的 43 个 非 重复 基因 的 编码 序列 为 对 象 ， 采 用 CodonW1.4.2 软件 分 析 密 码 子 偏好 
参数 : 同 义 密码 子 相 对 使 用 度 CRSCU, relative synonymous codon usage)、 有 效 密码 子 数目 

(ENC, effective number of codon), 其 最 小 理论 值 为 20, 说 明 每 个 氨基 酸 都 只 有 一 个 密码 子 ， 

最 大 理论 值 为 61, 说 明 所 有 密码 子 都 均等 使 用 、 密 码 子 适 应 指数 (CAL codon adaption index), 
变化 范围 为 0~ 1， 值 越 大 偏 性 越 强 、 密 码 子 偏好 性 指数 (CBIL codon bias index)， 最 优 密码 子 
使 用 频率 (FOP, frequency of optimal codons)， 该 基因 表达 为 蛋白 质 的 疏水 性 (Gravy) 及 不 同位 
置 的 GC 含量 ， 包 括 GC1，GC2，GC3，GC3S，GC12 和 GC， 分 别 代 表 密 码 子 中 第 1，2， 
3 位 的 GC 含量 , 第 3 位 同 义 密码 子 GC 含量 , 第 1，2 位 密码 子平 均 GC 含量 和 密码 子 总 体 
的 GC 含量 。 
1.2.2 中 性 绘图 分 析 

为 了 初步 确定 影响 密码 子 偏好 的 因素 , 中 性 绘图 分 析 根 据 GC1 和 GC2 的 信息 计算 两 者 
的 平均 值 GC12 作为 纵 坐 标 ， 以 GC3 为 横 坐 标 ， 以 散 点 图 的 形式 在 坐标 中 定位 各 基因 的 位 
置 , 根据 基因 的 坐标 信息 与 坐标 对 角 线 的 关系 ， 若 基因 位 于 对 角 线 上 ， 则 表明 基因 受 突变 作 
用 ; 阁 基 因 不 位 于 对 角 线 ， 则 表明 该 基因 收 到 选择 的 影响 ， 从 而 判断 造成 密码 子 的 使 用 偏好 
的 因素 。 
1.2.3 ENC-plot 绘图 

为 了 进一步 确定 影响 密码 子 偏好 的 因素 ，ENC-plot 绘图 以 ENC 为 纵 坐 标 ， 以 GC3S 为 
横 坐 标 建 立 坐 标 系 ， 将 各 基因 定位 在 该 坐标 中 形成 散 点 图 。 再 在 坐标 系 中 添加 ENC 的 标准 
曲线 ， 标 准 曲 线 方程 (Wright, 1990) 为 : 
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ENC,,,-224 GC35+— 2 
GC35* - (1-GC35S)* 


(1) 式 
ENC 比值 的 公式 为 : 
_ ENCew—ENCoss 


ENC Ratio 一 C EN — (2) 式 


根据 散 点 图 和 ENC 比值 的 分 布 结果 ; 若 偏离 标准 曲线 ， 则 表明 受到 选择 作用 ; 者 在 标准 曲 
线 上 ， 则 只 是 受到 突变 作用 从 而 推断 造成 密码 子 偏好 的 可 能 原因 。 
1.2.4 对 应 分 析 
对 应 分 析 是 一 种 对 原始 数据 采用 适当 的 标 度 方法 , 将 变量 和 样本 分 析 结 合 起 来 , 同时 得 
到 两 方面 的 结果 , 在 同一 因子 平面 上 对 变量 和 样本 一 起 进行 分 类 ,从 而 揭示 样本 和 变量 间 的 
内 在 联系 。 利 用 CodonW 软件 将 对 应 分 析 用 于 巨 核 叶 绿 体 基因 组 密码 子 分 析 ， 从 而 揭示 巨 
核 叶绿体 基因 组 密码 子 使 用 的 规律 。 
1.2.5 最 优 密码 子 的 确定 
为 了 确定 最 优 密 码 子 , 本 文 以 ENC 参数 为 标准 对 所 有 参 试 基因 按 从 大 到 小 的 顺序 排列 ， 
分 别 从 ENC 最 高 和 最 低 两 端 都 选取 所 有 参 试 基因 的 10%， 建 立 高 表达 和 低 表 达 库 。 


ARSCU = RSCU,ighexpressiongenes E RSCU, oOwexpression genes 
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(3) 式 


将 高 表达 库 与 低 表 达 库 的 同 义 密码 子 相 对 使 用 度 的 差 值 (外 3SC 加 高 于 0.08 HEX 


密码 子 相对 使 用 度 ( ”RSCU) 高 于 1 的 密码 子 确定 为 最 优 密码 子 ( 李 娟 和 薛 庆 中 , 2005; 续 晨 
等 , 2010; 杨 国 锋 等 ,2015; 王 鹏 良 等 , 2018)。 


2. 结 果 与 分 析 


A 


2.1 密码 子 组 成 分 析 
为 了 更 加 准确 分 析 密 码 子 1 


码 子 且 编码 


软件 对 参 试 基因 


第 1，2 位 日 


5 GC 含量 明显 高 于 第 3 位 。ENC 的 范 
CAI 的 范围 为 0.082~0.301， 平 均值 为 0.1714。CBI 


其 平均 值 为 0.3$6。 和 蛋白 


FOP 的 范围 为 0.263~0.532， 


平均 值 为 0.017。 


Gene 
psbA 
matK 
atpA 
atpF 
atpl 
rpsà 
rpoB 
psbD 
psbC 
psaB 
psaA 
ycf3 
rps4 
ndhJ 
ndhC 
atpE 
atpB 
rbcL 
ycfA 
cem A 
pet ^ 
rpsl8 
rpl20 
clpP 
psbB 
petB 
rpoA 
rpsll 
rps8 
rpll4 
rpll16 


Tablel 


GCI 

0.504 
0.402 
0.558 
0.478 
0.482 
0.445 
0.503 
0.527 
0.537 
0.487 
0.527 
0.477 
0.503 
0.525 
0.475 
0.518 
0.565 
0.575 
0.462 
0.394 
0.531 
0.376 
0.351 
0.589 
0.551 
0.493 
0.454 
0.522 
0.388 
0.533 
0.503 


GC2 
0.433 
0.312 
0.397 
0.332 
0.369 
0.432 
0.377 
0.434 
0.461 
0.429 
0.433 
0.387 
0.383 
0.387 
0.333 
0.406 
0.416 
0.435 
0.403 
0.279 
0.363 
0.416 
0.453 
0.364 
0.460 
0.414 
0.326 
0.587 
0.403 
0.386 
0.525 
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完 选 取 了 


巨 核 叶 绿 体 基 因 


组 中 以 AUG 为 起 始 密 


复 基因 的 编码 序列 汶 和 


究 对 象 ,采用 codonW 


和 分 析 。 结 果 ( 表 1) 表明 : 不 同 基 因 密 码 子 不 
同位 置 的 GC 含量 并 不 相同 ， 第 1、2、3 位 密码 子 的 GC 含量 的 变化 范围 分 别 为 
34.20%~58.90%,27.90%~58.70%,20.20%~37.00%, 其 平均 值 分 别 为 47.40%,39.47%,27.97%; 
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表 1 巨 核 叶 绿 体 基因 


M 


围 在 39.49-61.00 之 间 ， 习 
的 范 


均值 为 47.04。 


围 为 -0.222~0.196， 平 均值 为 -0.092。 
UH) Gravy 变化 范围 


为 -0.704~1.102， 


Main parameters in chloroplast genomics of Eucalyptus grandis 


GC3 
0.328 
0.276 
0.248 
0.348 
0.263 
0.271 
0.280 
0.317 
0.302 
0.308 
0.324 
0.333 
0.263 
0.285 
0.259 
0.255 
0.284 
0.288 
0.342 
0.297 
0.315 
0.248 
0.231 
0.323 
0.282 
0.274 
0.207 
0.202 
0.328 
0.240 
0.222 


GC 
0.422 
0.330 
0.401 
0.380 
0.371 
0.383 
0.387 
0.420 
0.433 
0.408 
0.428 
0.399 
0.383 
0.399 
0.356 
0.393 
0.421 
0.433 
0.402 
0.323 
0.403 
0.347 
0.345 
0.426 
0.431 
0.394 
0.349 
0.437 
0.373 
0.388 
0.417 


GC3S 
0.284 
0.257 
0.232 
0.330 
0.235 
0.236 
0.259 
0.272 
0.263 
0.263 
0.283 
0.304 
0.245 
0.242 
0.198 
0.227 
0.261 
0.260 
0.309 
0.251 
0.303 
0.232 
0.211 
0.283 
0.241 
0.216 
0.247 
0.173 
0.302 
0.227 
0.167 


ENC 
41.24 
51.29 
44.61 
48.37 
44.97 
47.19 
48.77 
44.02 
45.82 
47.83 
50.26 
61.00 
51.59 
47.52 
46.03 
50.16 
45.37 
46.54 
50.13 
45.87 
52.23 
43.41 
45.47 
53.46 
45.75 
39.49 
48.93 
42.79 
47.18 
44.66 
41.74 


日 密码 子 主要 参数 
CAI CBI 
0.301 0.196 
0.167 -0.141 
0.203 -0.037 
0.155  -0.106 
0.168 -0.075 
0.167 -0.174 
0.149 -0.121 
0.263 0.083 
0.196 -0.003 
0.182 -0.108 
0.197 -0.099 
0.151  -0.178 
0.155  -0.053 
0.162 -0.180 
0.182 -0.104 
0.164 -0.054 
0.202 -0.006 
0.265 0.071 
0.183 -0.032 
0.188 -0.046 
0.189 -0.048 
0.106 -0.153 
0.082 -0.222 
0.181 -0.123 
0.185 -0.073 
0.216 -0.046 
0.157 -0.122 
0.152 -0.140 
0.108 -0.042 
0.165 -0.070 
0.121 -0.100 


FOP 
0.532 
0.331 
0.393 
0.358 
0.353 
0.316 
0.341 
0.465 
0.406 
0.356 
0.358 
0.335 
0.372 
0.302 
0.324 
0.375 
0.406 
0.464 
0.389 
0.377 
0.382 
0.313 
0.263 
0.332 
0.372 
0.372 
0.345 
0.331 
0.380 
0.361 
0.357 


Gravy 
0.341 
-0.172 
-0.055 
-0.345 
0.625 
-0.282 
-0.286 
0.359 
0.265 
0.117 
0.259 
-0.502 
-0.606 
-0.273 
1.094 
-0.068 
-0.035 
-0.284 
0.240 
0.248 
-0.114 
-0.614 
-0.551 
0.088 
0.113 
0.582 
-0.334 
-0.415 
-0.325 
-0.043 
-0.460 


Item 
GC2 
GC3 
GC 


rps3 0.476 0.347 0.259 0.361 0.227 43.47 0.154 -0.150 0.329 -0.318 
rpl22 0.419 0.369 0.269 0.352 0.220 47.47 0.198 -0.075 0.393 -0.704 
ycf2 0.414 0.344 0.370 0.376 0.343 53.16 0.158 -0.140 0.337 -0.435 
ndhB 0.421 0.384 0.317 0.375 0.280 47.80 0.164 -0.084 0.354 0.685 
rps] 0.529 0.458 0.246 0.411 0.215 43.44 0.188 -0.055 0.389 -0.593 
ndhF 0.370 0.364 0.221 0.319 0.181 43.50 0.133 -0.210 0.282 0.535 
ccsA 0.342 0.379 0.273 0.331 0.221 47.49 0.139 -0.198 0.295 0.551 
ndhD 0.406 0.366 0.270 0.347 0.230 46.76 0.135 -0.129 0.316 0.788 
ndhE 0.396 0.337 0.248 0.327 0.224 49.43 0.142 -0.198 0.286 0.734 
ndhG 0.438 0.341 0.261 0.347 0.231 45.73 0.140 -0.181 0.278 1.102 
ndhl 0.426 0.378 0.228 0.343 0.194 42.59 0.203 -0.112 0.350 -0.036 
ndhH 0.509 0.369 0.254 0.377 0.202 48.27 0.155 -0.113 0.338 -0.145 
平均 0.474 0.395 0.280 0.383 0.246 47.04 0.171 -0.092 0.356 0.017 


密码 子 参数 的 相关 分 析 C20 表明 ，GC1 5 GC2 为 显著 相关 ， 其 相关 系数 为 0.363; 
GC1 5E GC3 相关 不 显著 ，GC2 与 GC3 相关 也 不 显著 ; 同时 GC 含量 与 GC1 和 GC2 极 显著 
相关 ， 与 GC3 无 显著 相关 。ENC 与 GCI 不 相关 ， 与 GC2 SE ABA, 5 GC3 BE E IER 
K, 其 相关 系数 为 0.321.GC1 和 GC 两 个 参数 与 CAL CBI 和 FOP 极 显著 相关 , GC3 与 CAL 
CBI 和 FOP ERIX; Gravy 与 其 余 的 密码 子 参数 均 无 显著 相关 ; 密码 子 数 目 OND 与 
GC3 极 显著 相关 外 ， 不 与 ENc 和 CAI 等 其 他 参数 显著 相关 。 


表 2 密码 子 参数 的 相关 性 分 析 


Table 2 Correlation analysis of the parameters of coding sequences’ codon usage 


GCI GC2 GC3 GC GC3S ENC CAI CBI FOP Gravy 
0.363* 
0.117 . -0.258 


0.857" 0.669" 0.300 


GC3S 0.114 -0.282 0.950" 0.266 


ENc 
CAI 
CBI 
Fop 


0.008 -0.365' 0.521" 0.000 0.584" 
0.551 0.084  0.320' 0.502" 0.225 -0.184 
0.513 0.213 | 0.340' 0.555" 0.295 -0.263 0.813" 
0.526" 0.241 | 0.380' 0.593" 0.338" -0.188 0.834" 0.997" 


Gravy -0.120  -0.270 0.040 -0.204 -0.091 -0.188 0.177 0.045 -0.091 


N 


-0.030 -0.122 0.399" 0.062 0.397 0.234 0.071 -0.018 0.023 
HE: “表示 在 0.05 水 平 上 显著 相关 ; “表示 在 0.01 水 平 上 显 车 相关 。 


Note: * means significant correlation at 0.05 level; ”means significant correlation at 0.01 level. 


RSCU 分 析 〈 表 3) 表明 ，RSCU 大 于 1.00 的 密码 子 数目 为 31 个 。 其 中 ， 以 UU 结尾 的 
密码 子 有 16 个 ， 以 A 结尾 的 密码 子 有 13 个， 以 G 和 CC 结尾 的 密码 子 分 别 为 1 个。 以 A 或 
U 结尾 的 密码 子 占 全 部 的 93.54%。 


表 3 巨 核 叶 绿 体 基 因 同 义 密码 子 相 对 使 用 度 


Table3 Relative synonymous codon usage analysis of genes on chloroplast genome in 


Eucalyptus grandis 


密码 子 。 数目 氨基酸 au 数目 


-0.025 


Amino acid Codon | Number Amino acid Codon | Number 

Phe UUU 584 1.28 Ser UCU 340 1.8 
UUC 329 0.72 UCC 192 1.02 
Leu UUA 562 1.99 UCA 202 1.07 
UUG 321 1.14 UCG 110 0.58 
CUU 366 1.3 Pro CCU 268 1.68 
CUC 105 0.37 CCC 107 0.67 
CUA 241 0.85 CCA 185 1.16 
CUG 99 0.35 CCG T] 0.48 
Ile AUU 657 1.48 Thr ACU 337 1.68 
AUC 266 0.6 ACC 156 0.78 
AUA 412 0.93 ACA 222 1.11 
Met AUG 385 1 ACG 86 0.43 
Val GUU 309 1.44 Ala GCU 455 1.88 
GUC 93 0.43 GCC 143 0.59 
GUA 339 1.58 GCA 269 1.11 
GUG 119 0.55 GCG 102 0.42 
Tyr UAU 475 1.63 Cys UGU 120 1.45 
UAC 107 0.37 UGC 46 0.55 
TER UAA 22 1.57 TER UGA 11 0.79 

UAG 9 0.64 Trp UGG 312 1 
His CAU 312 1.57 Arg CGU 226 1.52 
CAC 85 0.43 CGC 58 0.39 
Glin CAA 424 1.5 CGA 214 1.44 
CAG 140 0.5 CGG 50 0.34 
Asn AAU 532 1.53 Ser AGU 224 1.19 
AAC 164 0.47 AGC 65 0.34 
Lys AAA 521 1.51 Arg AGA 244 1.64 
AAG 169 0.49 AGG 102 0.68 
Asp GAU 504 1.62 Gly GGU 405 1.42 
GAC 118 0.38 GGC 119 0.42 
Glu GAA 610 1.49 GGA 450 1.57 
GAG 209 0.51 GGG 169 0.59 


2.2 中 性 绘图 分 析 
巨 核 叶绿体 基因 中 性 绘图 表明 ，GC12 的 变化 范围 为 33.65%~55.45%，GC3 的 变化 范围 
为 20.20%~37.00%，GC12 与 GC3 未 达到 显著 水 平 ， 说 明 GC12 与 GC3 相关 性 弱 。 突 变 对 
密码 子 第 1、2 位 和 第 3 位 碱 基 组 成 有 着 不 同 的 影响 。 假 如 完全 由 随机 突变 造成 的 ， 那 么 基 
因应 该 在 对 角 线 上 ， 图 1 中 绝 大 多 数 基因 都 分 布 于 对 角 线 上 方 ，GC12 均 高 于 GC3， 绝 大 多 
数 基 因 所 在 的 位 点 高 于 对 角 线 ， 这 说 明 选 择 在 密码 子 偏好 中 起 主要 作用 。 
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1 巨 核 叶 绿 体 基 因 中 性 绘图 分 析 
Fig.l Neutrality plot analysis of genes on chloroplast of Eucalyptus grandis 


2.3 ENC-plot 分 析 


ENC-plot 绘图 以 ENC X y $, GC3S 73 x 5i 
标 系 中 ， 同 时 根据 公式 (1) 添 加 标准 曲线 。ENC-plot 分 析 结 果 ( 图 
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建立 坐标 系 ， 将 所 有 参 试 基因 定位 于 该 坐 


2) 表明 ,尽管 有 一 小 部 分 


偏离 标准 曲线 ， 大 多 数 基因 位 于 标准 曲线 附近 。 为 了 更 加 准确 反映 差异 ， 本 文 根 据 (1) 式 求 
出 ENC 的 理论 值 ， 再 根据 (2) 式 求 算 出 ENC 比值 。 在 此 基础 上 分 析 所 有 参 试 基因 的 ENC 频 
数 分 布 〈 表 4)， 统 计 结 果 表 明 ，51.16% 的 基因 分 布 在 -0.05~ 0.05 之 间 ，34.88% 的 基因 分 布 
在 0.05~ 0.15 之 间 。9.30% 的 基因 分 布 在 -0.15~ -0.05 之 间 ， 另 有 2.33% 的 基因 分 布 在 -0.25~ 


-0.15 和 0.15~ 0.25 之 间 。 这 说 明 突 变 对 巨 校 叶 绿 体 基 因 


组 密码 子 偏 好 的 形成 起 重要 作用 。 


GC3S 


图 2 巨 核 叶 绿 体 基 因 


的 ENC-plot 分 析 


Fig.2 ENC-plot analysis for genes on chloroplast genome in Eucalyptus grandis 
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表 4 巨 校 叶绿体 基因 ENC 比值 频数 分 布 
Table 4 ENC ratio of genes of chloroplast genome in Eucalyptus grandis 


分 组 数目 频率 /% 
Group Number Frequency 
-0.25~ -0.15 1 2.33 
-0.15~ -0.05 4 9.30 
-0.05~ 0.05 22 51.16 
0.05~ 0.15 15 34.88 
0.15~ 0.25 1 2.33 


2.4 对 应 分 析 

对 应 分 析 表 明 ， 第 1 轴 贡 献 率 为 17.68%， 第 2 轴 贡 献 率 为 11.49%， 第 3、4 轴 的 贡献 
率 分 别 8.00% 和 5.7696. 前 4 个 向 量 的 总 贡献 率 为 42.93%。 第 1 轴 和 第 2 轴 的 贡献 率 均 超过 
10%， 说 明 第 1 轴 和 第 2 轴 都 是 密码 子 偏好 的 主要 影响 因素 。 第 1 轴 与 与 GC、 CAI. CBI 
和 Fop 呈 极 显著 的 正 相 关 ， 其 相关 系数 分 别 为 0.573、0.670、0.578 和 0.523; 第 1 fi ENC 
呈 极 显著 的 负 相 关 ， 其 相关 系数 为 -0.395; 第 1 轴 与 GC3S 无 显著 相关 ， 而 与 第 3 位 同 义 密 
码 子 A 和 G 含量 呈 极 显著 相关 ， 其 相关 系数 分 别 为 -0.440 和 -0.606。 为 了 更 加 直观 的 观察 密 
码 子 偏好 ， 建 立 以 第 1 轴 为 x 轴 ， 以 第 2 轴 为 y 轴 的 平面 坐标 系 ， 将 所 有 参 试 基因 按 不 同 功 
能 分 布 于 坐标 系 中 (图 3)。 图 3 显示 核糖 体 蛋 白 基 因 分 布 相对 集中 ， 其 余 基因 分 布 相对 比较 
分 散 ， 说 明 核 糖 体 蛋白 基因 的 密码 子 偏好 相近 ， 与 其 他 基因 的 密码 子 偏好 相差 较 大 。 
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图 3 基于 RSCU 的 对 应 性 分 析 
Fig.3 Corresponding analysis of RSCU 


2.5 最 优 密码 子 的 确定 

本 文 以 密码 子 的 ENC 参数 为 标准 , 对 参 试 基因 进行 排序 , 从 两 端 各 选取 10% 的 基因 (本 
文中 两 端 各 选取 4 个 ), 分 别 建立 高 / 低 表达 基因 库 ; 在 此 基础 上 重新 计算 各 表达 库 的 RSCU， 
求 算出 两 个 库 的 ARSCU C 5)。 以 ARSCU>0.08 为 标准 确定 了 31 个 高 表达 密码 子 ( 表 5 中 
* 标 注 的 密码 子 )， 其 中 12 以 G 结尾 ，8 个 以 C 结尾 ，6 个 以 A 结尾 ，5 个 以 U 结尾 。 

将 表 3 中 的 高 频密 码 子 与 表 5 中 确定 的 高 表达 密码 进行 分 析 , 选取 其 中 共有 的 密码 子 作 
为 最 优 密 码 子 。 巨 核 叶 绿 体 基因 中 有 12 个 最 优 密码 子 为 UUG、CUU、GUU、UCC、UCA、 


ACA, UAU, UAA, CAU, AAU, AGA 和 GGA， 其 中 10 个 密码 子 以 U 或 A 结尾 ， 另 外 
2 个 以 G 或 C 结尾 。 


表 5 巨 校 叶 绿 体 基 因 高 / 低 表 达 库 的 同 义 密码 子 相对 使 用 度 
Table 5 Relative Synonymous Codon Usage of genes of chloroplast genome in Eucalyptus grandis 


高 表达 基因 低 表 达 基 因 
AER 密码 子 High expressed genes Low expressed genes 
数目 数目 
Amino acid Codon Number RSCU Number RSCU  ARSCU 
Phe UUU 102 1.08 27 1.04 0.04 
UUC 87 0.92 25 0.96 -0.04 
Leu UUA 51 1.02 23 1.97 -0.95 
UUG" 69 1.38 13 1.11 0.27 
CUU* 80 1.61 15 1.29 0.32 
CUC* 27 0.54 2 0.17 0.37 
CUA 43 0.86 14 1.2 -0.34 
CUG™ 29 0.58 3 0.26 0.32 
Ile AUU 103 1.33 4] 1.64 -0.31 
AUC* 55 0.71 13 0.52 0.19 
AUA" 75 0.97 21 0.84 0.13 
Met AUG 62 l 34 ] 0 
Val GUU* 51 1.5 22 1.35 0.15 
GUC* 20 0.59 6 0.37 0.22 
GUA 40 1.18 31 1.91 -0.73 
GUG™ 25 0.74 6 0.37 0.37 
Ser UCU 77 1.64 18 1.89 -0.25 
UCC* 52 1.11 8 0.84 0.27 
UCA** 55 1.17 5 0.53 0.64 
UCG 39 0.83 8 0.84 -0.01 
Pro CCU 41 1.3 27 2.63 -1.33 
CCC** 32 1.02 2 0.2 0.82 
CCA 34 1.08 11 1.07 0.01 
CCG* 19 0.6 l 0.1 0.5 
Thr ACU 35 1.13 27 2.04 -0.91 
ACC 25 0.81 10 0.75 0.06 
ACA” 43 1.39 13 0.98 0.41 
ACG” 21 0.68 3 0.23 0.45 
Ala GCU 42 1.75 39 2.44 -0.69 
GCC* 13 0.54 4 0.25 0.29 
GCA 25 1.04 17 1.06 -0.02 
GCG" 16 0.67 4 0.25 0.42 
Tyr UAU* 88 1.59 24 1.33 0.26 
UAC 23 0.41 12 0.67 -0.26 
TER UAA** 3 2.25 2 1.5 0.75 


UAG 1 0.75 2 1.5 -0.75 


His CAU" 


Gln CAA 


Arg AGA 一 


Gly GGU 


3. 讨 论 


1.52 10 1.05 0.47 
0.48 9 0.95 -0.47 
1.4 19 1.73 -0.33 
0.6 3 0.27 0.33 
1.52 21 1.17 0.35 
0.48 15 0.83 -0.35 
1.25 19 1.73 -0.48 
0.75 3 0.27 0.48 
1.68 15 1.67 0.01 
0.32 3 0.33 -0.01 
1.25 35 1.56 -0.31 
0.75 10 0.44 0.31 
1.29 13 1.86 -0.57 
0.71 0.14 0.57 

0 0 0 0 

1 20 1 0 
0.68 22 2.4 -1.72 
0.37 8 0.87 -0.5 
1.49 13 1.42 0.07 
0.61 0 0 0.61 
0.91 14 1.47 -0.30 
0.34 4 0.42 -0.08 
1.8 10 1.09 0.71 
1.05 2 0.22 0.83 
0.95 43 2.39 -1.44 
0.49 7 0.39 0.1 
1.76 18 1 0.76 
0.81 4 0.22 0.59 


遗传 密码 是 指 核 昔 酸 序列 与 氨基 酸 序列 的 对 应 关系 。20 种 蛋白 质 氨基 酸 中 Met 和 Trp 
其 余 18 种 氨基 酸 均 有 2~6 个 不 等 密码 子 编码 ， 即 密码 子 的 简 


两 种 氨基 酸 只 J 个 密 密码 子 ， 


并 且 明 显 小 于 GC1 和 GC2。 这 说 明 
结果 从 定量 分 析 的 角度 也 充分 证 明 这 一 观点 。 


并 性 ， 编 码 同一 氨基 酸 的 密码 子 为 同 义 密码 子 ( 朱 圣 庚 和 徐 长 发 , 2016) 。 同 义 密 码 子 差别 主 
要 在 于 第 三 位 密码 子 的 变化 。 本 文中 巨 校 叶绿体 基因 组 中 GC3 与 GC1 和 GC2 无 显著 相关 ， 


巨 校 叶绿体 基因 密码 子 偏好 以 A 和 TU 结尾，RSCU 分 析 


这 与 已 报道 的 黄 蕉 (Scutellaria baicalensis)( E. 


AC XK A. 2018), XM W Z (Camellia oleiferay( € WB R 5$, 2018), X 22 E ta (Medicago 
植物 叶绿体 基因 的 特征 一 致 。 


truncatula)( 杨 国 锋 等 , 2015)55 


生物 在 编码 氨基 酸 时 经 常 倾向 使 用 某 个 特定 的 同 义 密码 子 的 现象 称 为 密码 子 使 用 偏好 


性 ( 吴 宪 明 等 , 2007)。 巨 尾 校 叶绿体 基因 扣 


ENC 低 于 35 的 为 强 偏 好 性 密 


核 叶 绿 体 基因 组 密码 子 为 弱 
密码 子 偏好 受 碱 基 组 成 、 
影响 ( 梁 菲 菲 , 2010)。 本 文 


日 的 密码 子 的 ENC 平均 值 为 47.04。 以 35 为 标准 ， 
码 子 ， 高 于 35 的 为 弱 偏 好 性 密码 子 (Jiang, 2008)。 因 此 ， 巨 尾 


WEB], CAI 参数 也 支持 这 一 观点 。 
选择 、tRNA 丰 度 、 基 因 长 度 和 和 蛋白质 的 疏水 性 等 许多 因素 的 


由 于 密码 子 数目 


a 


不 与 ENC 及 CAI 等 密码 子 参 数 显著 相关 ， 所 


以 巨 核 叶 绿 体 基因 组 中 基因 长 度 对 密码 子 偏好 没有 明显 作用 ; 同样 蛋白 质 玻 水 性 对 巨 核 叶 绿 
体 基 因 组 密码 子 偏好 也 无 明显 作用 ; 同 义 密码 子 第 3 位 A 和 G 含量 及 GC 含量 与 第 1 轴 达 
到 极 显 著 相 关 ， 表明 碱 基 差 异 对 密码 子 的 偏好 也 有 影响 ; CAI、CBI 和 FOP 与 第 1 轴 极 显著 
相关 ， 表 明基 因 有 选择 地 使 用 高 丰 度 的 {NA 对 应 的 密码 子 ， 导 致 基因 的 高 表达 (Ikemura， 
1981a; 1981b;1985)， 所 以 选择 也 是 影响 密码 子 偏好 的 重要 原因 ; 由 于 第 3 位 A、G 含量 和 
GC 含量 与 第 1 轴 的 相关 系数 与 CAI、CBI 和 FOP 和 第 1 轴 的 相关 系数 比较 接近 ， 因 此 突变 
和 自然 选择 在 密码 子 偏好 中 的 作用 基本 相当 ,中 性 绘图 分 析 表 明 选 择 是 导致 密码 子 偏好 的 相 
对 主要 因素 ; 而 ENC-plot 分 析 结 果 显 示 突 变 也 占 较 大 比例 。 因 此 ， 本 文 认 为 突变 和 选择 在 
巨 核 叶 绿 体 基因 组 中 可 能 起 相对 均衡 的 作用 。 

本 文 以 高 表达 的 高 频密 码 子 为 最 优 密码 子 ， 在 巨 校 叶 绿 体 基因 组 中 确定 的 12 个 最 优 密 
码 子 分 别 为 UUG、CUU、GUU、UCC、UCA、ACA、UAU、UAA、CAU、AAU、AGA 和 
GGA。 巨 核 叶 绿 体 基因 组 最 优 密 码 子 的 确定 为 优化 目标 基因 的 密码 子 ， 提 高 表达 效率 ， 从 
而 利用 叶绿体 基因 工程 改良 巨 校 重要 性 状 疯 定 良 好 基础 。 


P 
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